Themen für Interessierte oder Fortgeschrittene (ggf. auch Abschlussarbeiten aktuell oder zukünftig):

Publishing mit https://pandoc.org/

  • Evaluation Pandoc Markdown; roundtrip mit
    • Jupyter Notebook Markdown
    • Dokuwiki Markdown plugin
    • html
  • Einbindung Literatur- /Link-Verwaltungen
    • eigenes Pandoc-Format
    • Zotero
    • Citavi
  • Pandoc Erweiterung mit https://pandoc.org/filters.html
  • Pandoc Lua-Filter

Semantisches Feature Engineering

  • semantische Vorverarbeitung von Daten für bessere Machine Learning Scores

Beispiele für fancy Visualisierungs-Techniken

  • matplotlib, seaborn u.V.m.
  • auch live 3D-Navigation?

Daten-Vorverarbeitung mit https://www.nltk.org/

Analyse eines Keylogger-Datenstroms

Doubletten-Erkennung mit https://dedupe.io/